检索结果

Select

1. 基于请求与应答通信机制和局部注意力机制的多机器人强化学习路径规划方法

邓辅秦, 官桧锋, 谭朝恩, 付兰慧, 王宏民, 林天麟, 张建民

《计算机应用》唯一官方网站 2024, 44 (2): 432-438. DOI: 10.11772/j.issn.1001-9081.2023020193

摘要（100）

HTML （1）

PDF （1916KB）（57）

为降低多机器人在动态环境下路径规划的阻塞率，基于深度强化学习方法框架Actor-Critic，设计一种基于请求与应答通信机制和局部注意力机制的分布式深度强化学习路径规划方法（DCAMAPF）。在Actor网络，基于请求与应答通信机制，每个机器人请求视野内的其他机器人的局部观测信息和动作信息，进而规划出协同的动作策略。在Critic网络，每个机器人基于局部注意力机制将注意力权重动态地分配到在视野内成功应答的其他机器人局部观测和动作信息上。实验结果表明，与传统动态路径规划方法D^* Lite、最新的分布式强化学习方法MAPPER和最新的集中式强化学习方法AB-MAPPER相比，DCAMAPF在离散初始化环境，阻塞率均值均约降低了6.91、4.97、3.56个百分点；在集中初始化环境下能更高效地避免发生阻塞，阻塞率均值均约降低了15.86、11.71、5.54个百分点，并减少占用的计算缓存。所提方法确保了路径规划的效率，适用于求解不同动态环境下的多机器人路径规划任务。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 结合遗传算法和滚动调度的多机器人任务分配算法

邓辅秦, 黄焕钊, 谭朝恩, 付兰慧, 张建民, 林天麟

《计算机应用》唯一官方网站 2023, 43 (12): 3833-3839. DOI: 10.11772/j.issn.1001-9081.2022121916

摘要（382）

HTML （6）

PDF （2617KB）（218）

研究多机器人任务分配（MRTA）的目的是提高智能工厂中机器人完成任务的效率。针对现有算法在处理大规模、多约束的MRTA时存在不足的问题，提出一种结合遗传算法和滚动调度的MRTA算法（ACGARS）。首先，在遗传算法中采用基于有向无环图（DAG）的编码方式高效地处理任务之间的优先级约束；其次，在遗传算法的初始种群中加入先验知识以提高算法的搜索效率；最后，设计基于任务组的滚动调度策略用于减小求解问题的规模，从而实现对大规模问题的高效求解。在大规模问题实例上的实验结果表明，相较于构造性启发式算法（CHA）、最小化干扰算法（MIA）和基于惩罚策略的遗传算法（GAPS）生成的方案，当任务组数为20时，所提算法生成的方案的平均订单完成时间分别缩短了30.02%、16.86%和75.65%，验证了所提算法能有效地缩短订单的平均等待时间，提升多机器人任务分配效率。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于请求与应答通信机制和局部注意力机制的多机器人强化学习路径规划方法

邓辅秦官桧锋谭朝恩付兰慧王宏民林天麟张建民

《计算机应用》唯一官方网站 DOI: 10.11772/j. issn.1001-9081.2023020193
预出版日期: 2024-01-06